CAPTULO 5
A TEORIA DE APRENDIZAGEM SOCIAL
121
Esta corrente, que podemos seguramente considerar como uma das principais no campo da
Psicologia do Desenvolvimento, teve sua origem nos trabalhos de Miller, Dollard, Mowrer, Sears e 
outros psiclogos famosos do chamado grupo de Vale. Em 1941 foi publicado o livro Social 
Learning and imitation, de MilIer e Dollard, no qual os autores tentaram integrar as formulaes 
da teoria da aprendizagem de Clark HulI com a evidncia de antropologia cultural, e sociologia em 
um esquema explicativo do comportamento humano mais complexo. O segundo livro de Dollard e 
Miller, Personality and Psychotherapy (1950), apresentou uma sntese de conceitos da teoria 
freudiana, da teoria de aprendizagem de HuIl e da antropologia cultural. O trabalho de Milier e 
Dollard  apontado como responsvel por ter trazido noes freudianas para dentro do domnio da 
Psicologia cientfica. Com isto queremos dizer que as contribuies da teoria psicanaltica, 
inicialmente rejeitadas como no cientficas pelos psiclogos americanos que trabalhavam nas 
universidades e seus laboratrios, em reas consideradas cientificamente mais respeitveis como 
aprendizagem, foram difundidas por Miller e Dollard, que iniciaram um movimento no sentido de 
explicar conceitos psicanalticos em termos da teoria da aprendizagem de HuIl (1943), termos esses 
in        teligveis aos psiclogos acadmicos. Um dos exemplos  o conhecido paradigma de 
deslocamento de Milier, em que o conceito psicanaltico do mecanismo de defesa de deslocamento  
explicado em termos de generalizao e grandientes de excitao e inibio. 
Miller e Dollard, pode-se dizer, deram origem a uma linha de trabalho em Psicologia do 
Desenvolvimento, em que hipteses baseadas na teoria psicanaltica foram testadas empiricamente, 
atravs de pesquisas em que a metodologia cientfica foi usada com razovel rigor: Temos como 
exemplo disto os trabalhos de Whiting e Child (1953), Grinder (1962) e muitos outros, em que o 
desenvolvimento moral  estudado sob este enfoque, como veremos no captulo 10. Contudo, deve-
se notar que Miller e Dollard insistem em que seu trabalho no consiste em mera traduo de 
conceitos psicanalticos em termos de aprendizagem, mas que elaboraram uma teoria do 
desenvolvimento da personalidade em termos de princpios de aprendizagem, tendo apenas utilizado 
alguns conceitos freudianos mais aceitvis, como variveis interessantes a serem estudadas. 
A teoria de MilIer e Dollard  uma teoria S-R liberalizada, como explica MilIer em seu trabalho 
intitulado Liberalization Df S-R Concepts (1962) no sentido em que faz uso de respostas 
subjetivamente observveis, tais como medo, pensamentos, motivao, conceitos centrais na teoria. 
Mais recentemente, o ponto de vista S-R na Psicologia do Desenvolvimento tem enfatizado o 
modelo de Skinner, mais do que o de HuII, sendo que a diferena fundamental entre os dois consiste 
no uso de construtos hipotticos ou variveis intervenientes. Enquanto HulI admite o uso de 
construtos, isto , processos inferidos a partir de estmulos e respostas observveis, mas que 
ocorrem dentro do organismo, tais como ansiedade, drive, motivao, Skinner rejeita a utilidade de 
tais construtos, limitando-se a estudar as variveis diretamente observveis, isto , os estmulos e as 
respostas, e as relaes funcionais entre elas. A influncia skinneriana na Psicologia do 
Desenvolvimento  exemplificada nos trabalhos de Bandura, Bijou, Baer e outros (Bandura, 1963; 
1969; 1973; Bijou e Baer, 1961, 1965). 
CONCEITOS CENTRAIS DA TEORIA DE APRENDIZAGEM SOCIAL 
Aprensentamos a seguir uma reviso dos princpios e conceitos bsicos das teorias da 
aprendizagem. que so agora aplicados  explicao dos processos de aquisio dos 
comportamentos humanos mais complexo, geralmente conceituados como pertencentes ao mbito 
da Psicologia da Personalidade ou da Psicologia Social. 
Estmulo: Chama-se estmulo qualquer evento que atua sobre um organismo. 
Resposta: Chama-se resposta qualquer comportamento emitido por um organismo. 
Condicionamento: De acordo com o ponto de vista behaviorista, toda aprendizagem  feita atravs 
de condicionamento. 
H dois tipos bsicos de condicionamento: Condicionamento clssico e condicionamento 
operante. O condicionamento clssico  tambm chamado pavloviano, por contigidade, S-S, ou 
respondente.  chamado clssico por ter sido o primeiro tipo de condicionamento a ser estudado.  
chamado pavloviano, por ter sido primeiramente estudado por Pavlov.  chamado S-S, porque a 
conexo fortalecida ou aprendida  entre dois estmulos, como veremos a seguir.  chamado 
condicionamento por contigidade, porque o princpio atuante  o de contigidade ou de ocorrncia 
simultnea. O que fortalece a conexo entre os dois estmulos  o fato de ocorrerem juntos. 
Finalmente,  chamado de respondente, porque parte de uma ao reflexa em que um determinado 
estmulo naturalmente provoca uma determinada resposta. Para efeito de definio de termos, 
tomemos o exemplo clssico estudado por Pavlov: diante do estmulo carne, o cachorro naturalmente 
d a resposta de salivao. Dizemos ento que no caso a carne  um estmulo incondicionado e que 
salivar  uma resposta incondicionada quele estmulo, porque a carne naturalmente provoca 
salivao, no requerendo este processo qualquer aprendizagem ou condicionamento. Agora, se 
junto com a carne apresentarmos um estmulo neutro, isto , que no provocaria normalmente a 
salivao, depois de vrias apresentaes sucessivas de carne junto com o estmulo neutro, por 
exemplo, o som de uma campainha, este passaria tambm a provocar salivao, mesmo quando 
apresentado sem 
122 
123 
1 
a carne. Dizemos ento que o som da campainha se tornou um um estmulo condicionado, que 
provoca ento a resposta condicionada de salivao. O processo  ilustrado diagramaticamente na 
figura 18 abaixo. 
Estmulo incondicionado 
(carne) 
Resposta incondicionada 
(salivao) 
Estmulo condicionado * Resposta incondicionada 
(campainha) 
Fig. 18  O condicionamento clssico. 
Os melhores resultados de condicionamento so obtidos quando o estmulo condicionado  
apresentado pouco antes (alguns segundos) do estmulo incondicionado. No condicionamento 
chamado de trao, em que se demora a apresentao do estmulo incondicionado, a resposta 
condicionada tambm demora mais a ocorrer, com uma latncia aproximadamente igual  da 
demora entre o estmulo incondicionado e o condicionado.  importante notar que a eficcia do 
condicionamento depende tambm do estado do organismo, isto , se o cachorro est com fome, 
obtm-se mais rapidamente o condicionamento descrito acima do que se est saciado. Em ambiente 
natural, vemos que as crianas aprendem muitas reaes por condicionamento de contigidade, 
especialmente reaes de medo, ansiedades, fobias. Por exemplo, se uma criana levou uma 
palmada por se comportar mal no jardim zoolgico, defronte do viveiro de aves, poder adquirir 
medo de aves. Se a criana  punida por no comer o espinafre, pode associar o estmulo aversivo 
(punio) com o espinafre e passar a detest-lo ainda mais. 
Condicionamento operante:  tambm chamado skinneriano, por reforo, S-R, ou instrumental.  
chamado operante, porque se faz a partir de respostas do organismo, que tm um efeito sobre o 
ambiente. So respostas que no so dadas a nenhum estmulo identificado (como no caso do 
condicionamento clssico) e que tm uma conseqncia.  chamado skinneriano, porque tem sido 
enfatizado por Skinner, embora este tipo de condicionamento tenha sido extensivamente usado por 
Huli e embora se possa dizer que a lei do efeito de Thorndike foi uma precursora da noo de 
reforo e de condicionamento operante.  chamado condicionamento por reforo, porque o que 
fortalece a conexo  o reforo, ou a conseqncia que um com- 
124 
portamento gera.  chamado S-R, porque a conexo fortalecida  entre um estmulo e uma resposta 
e no mais entre dois estmulos, como no condicionamento clssico.  chamado instrumental, porque 
a resposta serve como instrumento para a obteno do reforo. O paradigma do condicionamento 
operante pode ser melhor entendido examinando-se a situao bsica da caixa de Skinner. 
A caixa de Skinner  uma gaiola cbica em que h uma barra e um dispensador de bolinhas de 
alimento. Ao ser colocado na gaiola, o organismo (geralmente um rato) emite uma srie de 
comportamentos (operantes), que so espontneos, isto , no so resposta a nenhum estmulo 
identificvel. Acabar, acidentalmente, pelo menos, pressionando-se a barra. Sendo esta resposta 
seguida pelo aparecimento de uma bolinha de alimento, a resposta de apertar a barra tende a ser 
repetida. A diferena principal, portanto, entre os dois tipos de condicionamento  que no 
condicionamento clssico uma ao que j  resposta a um estmulo pode ser trazida sob controle de 
outro estmulo, atravs de associao ou contigidade. No condicionamento operante, qualquer 
resposta aleatria, que no est ligada a nenhum estmulo especfico, pode ser posta sob controle, 
por exemplo, a resposta operante de apertar a barra pode ser rapidamente colocada sob o controle 
de um estmulo reforador. 
Reforo: Chama-se de reforo ou estmulo reforador qualquer evento ambiental que, quando se 
segue  emisso de 
uma resposta, aumenta a probabilidade de ocorrncia da mesma. 
Reforo positivo: Chama-se reforo positivo a todo reforo que, quando se segue a uma resposta, 
aumenta a probabilidade de ocorrncia dessa resposta. Por exemplo, se uma bolinha de comida  
dada ao rato logo depois que ele aperta uma alavanca, o rato tender a repetir essa resposta de 
apertar a alavanca. A bolinha de comida  ento um reforo positivo. 
Reforo negativo: Chama-se reforo negativo qualquer estmulo que, quando retirado, aumenta a 
probabilidade de 
ocorrncia de uma resposta. Por exemplo, se a retirada de um choque eltrico faz com que o rato 
pressione a alavanca, o choque est agindo como um reforo negativo. 
125 
-( 
Punio: Refere-se  aplicao de um estmulo aversivo, que, quando  aplicado em seguida a um 
comportamento, 
diminui a probabilidade de ocorrncia desse comportamento. Por exemplo, se o rato apresenta um 
comportamento de apertar uma alavanca, e este comportamento passa a ser seguido por choque 
eltrico, o rato deixar de apertar a alavanca. 
Extino:  o processo de enfraquecimento de uma resposta. Usa-se geralmente o termo extino, 
quando o enfraquecimento da resposta  obtido atravs da retirada de reforos positivos, embora 
alguns autores tambm usem o termo extino em relao ao enfraquecimento de respostas obtidas 
atravs da estimulao aversiva (punio). A este caso preferimos reservar o termo inibio. Por 
que a necessidade dessa distino entre extino e inibio, se ambos os processos levam ao 
enfraquecimento das respostas? A razo da distino  que, tanto em experimentos com animais 
como em experimentos com seres humanos, os resultados indicam que, quando se faz uma extino 
(retirada de reforos positivos), o comportamento  realmente desaprendido e no retorna, a no ser 
em casos espordicos de recuperao espontnea, recuperao essa tambm passageira, ao passo 
que na inibio o comportamento parece ser apenas temporariamente inibido, mas no desaprendido 
e facilmente reaparece, uma vez removidas as condies aversivis. Vejamos um exemplo: Um 
comportamento desagradvel, freqentemente manifestado por crianas em idade pr-escolar,  o 
de birra, em que a criana chora, grita, esperneia, atira-se no cho, bate com a cabea na parede, 
etc. Se a criana est acompanhando a me s compras, v um brinquedo, quer que a me o 
compre, esta nega, a criana poder apresentar o comportamento do tipo descrito acima, com maior 
ou menor intensidade. A reao da me pode ser de trs tipos: a) ela compra o brinquedo, cedendo 
 criana e evitando o escndalo; neste caso, temos o reforo positivo e o comportamento tende a 
aumentar em freqncia, isto , a criana manifest-lo- em ocasies futuras em que quiser que os 
adultos cedam a suas exigncias; b) a me d uma palmada na criana; se a punio for 
suficientemente forte a criana talvez pare com a birra e no experimente outra vez, quando sair a 
fazer compras com a me; aparentemente, o comportamento foi eliminado, porm geralmente ele foi 
apenas temporariamente inibido; se a situao mudar um pouco e a estimulao aversiva 
(possibilidade de a me dar uma palmada) for removida, a criana provavelmente 
tentar novamente a birra; por exemplo, se sair com o pai, ou a av, poder tentar a birra a fim de 
obter suas exigncias; c) a me ignora a birra da criana; neste caso, a me no cede, porm 
tambm no pune, simplesmente ignora; ento o comportamento geralmente enfraquece e  
totalmente eliminado, no reaparecendo nem mesmo em outros contextos.  evidente que uma 
instncia apenas do reforo positivo, ou da punio, ou da extino, no tm geralmente um efeito 
to dramtico.  depois de algumas vezes em que um tipo de situao ocorre que se notam os 
efeitos. 
Reforo primrio: Chama-se reforo primrio a um estmulo que possui propriedades naturalmente 
reforadoras, ou seja, que reduzem necessidades primrias. Por exemplo, o alimento  um reforo 
primrio, porque reduz a necessidade primria da fome. 
Reforo secundrio: Qualquer estmulo ou objeto que naturalmente no possui propriedades 
reforadoras, mas que, 
por associao com um reforo primrio, passa a atuar como reforador, chama-se reforo 
secundrio. Por exemplo, uma ficha que fique associada a balas ou brinquedos pode adquirir 
propriedades reforadoras para uma criana, que passar a executar comportamentos a fim de 
ganhar as fichas apenas. O dinheiro  outro exemplo de reforador secundrio, O dinheiro em si no 
reduz necessidades primrias como as de fome ou sede, porm est associado com a reduo 
dessas necessidades e com a aquisio de muitas coisas que so reforos primrios positivos, de 
forma que o dinheiro adquiriu propriedades reforadoras e  o que chamamos um reforo 
secundrio. Muitos psiclogos behavioristas tm interpretado o amor da criana pela me como 
resultante desse processo: a me satisfaria as necessidades primrias da criana (fome, sede, etc.) 
de forma que seu rosto, bem como seus carinhos, ateno, ficariam associados com a reduo das 
necessidades primrias e a criana passaria ento a precisar do carinho materno. Este  um ponto 
de vista discutvel, apesar da teoria psicanaltica tambm apoiar essa posio, com a nfase na fase 
oral. As pesquisas de Harlow com macacos indicam que o contacto corporal com a me  uma 
varivel de maior importncia do que a alimentao (Harlow, 1958). (Ver captulo 14 para discusso 
mais completa deste assunto). Os esforos secundrios so muito importantes, pois seria impossvel 
utilizar-se apenas reforos primrios 
126 
127 
na socializao de crianas. Os reforos sociais, tais como elogios, bem como os reforos simblicos, como as 
fichas, so usados largamente tanto intuitivamente por mes, pais, educadores, como de maneira mais 
sistemtica nas tcnicas de modificao de comportamento. 
Generalizao e discriminao: Chamamos generalizao  propriedade pela qual estmulos 
semelhantes ao que originalmente foi condicionado produziram a mesma resposta. Por exemplo, se treinarmos 
um cachorro a salivar em resposta a um som com a freqncia de 250 ciclos por segundo (associando-o com a 
presena do alimento), veremos que o cachorro generalizar essa resposta para sons de 240 ciclos por 
segundo, 260 ciclos por segundo, etc. A generalizao  tanto maior, quanto mais semelhante o novo estmulo 
for ao estmulo original, isto , haver mais generalizao para um som de 260 ciclos por segundo do que para 
um de 280 ciclos por segundo. Este  um exemplo de generalizao em condicionamento clssico. A 
generalizao ocorre tambm no condicionamento operante: o reforo positivo de um comportamento tende a 
aumentar a probabilidade de ocorrncia deste comportamento especfico, e tambm de comportamentos 
semelhantes. Por exemplo, uma criana que recebe elogios por emprestar brinquedos aos irmos 
provavelmente ao entrar para o maternal tender a compartilhar brinquedos com os coleguinhas. 
Discriminao: o processo inverso da generalizao. Requer respostas diferentes a estmulos diferentes. 
Pode-se 
treinar a discriminao, reforando-se respostas a um estmulo e no a outro. Por exemplo, pode-se reforar um 
rato numa caixa de Skinner, se ele aperta a alavanca quando a luz est acesa e no refor-lo, se aperta a 
alavanca mas a luz est apagada. Ao fim de algumas tentativas, o rato dever ter aprendido a discriminao e 
s apertar a barra, quando a luz estiver acesa. Chamamos de SD (estmulo discriminativo) o estmulo em 
presena do qual o comportamento  reforado. No exemplo acima, a luz  o SD. Chamamos de S o estmulo em 
presena do qual o comportamento no  reforado, no caso, luz apagada. Os processos de generalizao e 
discriminao so ambos importantssimos na aquisio de comportamentos sociais complexos. A criana 
precisa aprender, por exemplo, que assim como ela  reforada por comer com boas maneiras em casa, tambm 
o ser se fizer assim em casa de outras pessoas (ge neralizao) 
O menino precisa aprender que se bater num coleguinha que o tenha agredido primeiro (S9 ser 
elogiado em casa, porm se bater no pai quando este o disciplinar com uma palmada (S9 no ser 
apreciado (discriminao). 
Esquemas de ref oramento: As pesquisas experimentais de Skinner e seus colaboradores (Ferster 
e Skinner, 1952) 
investigaram cuidadosamente os efeitos de diversos esquemas de reforamento. Por esquema de 
reforamento queremos nos referir  taxa com que os reforos so dispensados: podemos reforar 
um organismo por todos os comportamentos de determinada classe que forem emitidos 
(reforamento oontnuo ou total), ou podemos reforar algumas respostas de determinado tipo e 
no reforar outras respostas desse mesmo tipo (reforamento intermitente ou parcial). H vrios 
tipos de reforamento intermitente como se v no diagrama seguinte (fig. 19): 
Contnuo ou total 
Fig. 19  Esquemas de reforamento. 
[fixo L varivel 
razo 
fixa 
intervalo . 
( varivel 
combinado 
Pode ser feito um reforamento parcial de razo, em que o que se leva em conta  o nmero de 
respostas emitidas, por exemplo, o reforo vem sempre de 3 em 3 respostas, ou sempre de 4 em 4. 
Um exemplo de como isto ocorre na vida diria est no pagamento de empregados por comisso, 
em que o empregado recebe certa quantia cada vez que vender quatro carros. Este  um exemplo 
de reforamento de razo fixa, isto , o reforo vem sempre de 4 em 4 respostas. H tambm a 
razo varivel, em que o sujeito  reforado em torno de um valor mdio, isto , o reforo s vezes 
vem de 3 em 3 respostas, s vezes de 4 em 4, s vezes de 5 em 5, sendo a mdia 4. 
Reforamento 
Intermitente ou parcial 
128 
129 
No reforamento de intervalo, o que  levado em conta  o intervalo de tempo decorrido e no o nmero de 
respostas ou comportamentos emitidos. Por exemplo, o reforo pode ser dispensado sempre de dois em dois 
minutos, sendo irrelevante o nmero de respostas emitido. A primeira resposta depois de decorridos dois 
minutos recebe reforo. O reforamento por intervalo tambm pode ser fixo ou varivel. Um exemplo de 
esquema de intervalo fixo  o pagamento de salrio mensal. O reforo (pagamento) vem de 30 em 30 dias, 
independente do nmero de unidades produzidas. No reforamento por intervalo varivel, o intervalo de tempo 
entre reforos varia, s vezes, cinco minutos, s vezes dez, s vezes 15, etc., em torno de um valor mdio que 
pode ser por exemplo 10 minutos. O esquema combinado representa uma combinao de dois ou mais dos 
tipos descritos; por exemplo, pode-se executar um esquema em que os reforos venham de 10 em 10 minutos 
(intervalo fixo) e tambm de 10 em 10 respostas (razo fixa). A importncia de se conhecer esses diversos 
esquemas de reforamento  muito grande, uma vez que cada um deles tem efeitos diferentes sobre a rapidez 
de aquisio de um comportamento e tambm sobre sua resistncia  extino. Embora o reforamento 
contnuo seja altamente eficiente para assegurar a aquisio rpida de um comportamento, o reforamento 
intermitente  muito mais eficiente para gerar alta resistncia  extino. Por exemplo, um rato que recebe uma 
bolinha de alimento toda vez que aperta a barra na caixa de Skinner adquire essa resposta mais rapidamente do 
que um que s a recebe de vez em quando. No entanto, quando se deixa de dar o reforo, o segundo ratinho 
continua apertando a barra com uma freqncia alta durante muito mais tempo do que o primeiro, ou, em outras 
palavras, ele resiste muito mais  extino. Aplicando esses conhecimentos ao desenvolvimento da 
personalidade humana, vemos que uma criana que  reforada num esquema contnuo perde mais facilmente 
um comportamento assim estabelecido se o reforo  retirado do que uma que foi reforada de maneira 
intermitente. Se uma criana recebe reforos (presentes ou elogios) toda vez que arruma seus brinquedos, no 
momento em que se deixar de dar esses reforos ela protestar com reaes emocionais e se recusar a arrum-
los. No entanto, uma criana que tiver recebido reforos algumas vezes, e outras no, tende a manter o 
comportamento de arrumar os brinquedos  ela resiste mais  extino, pois j est acostumada  idia de que 
s vezes o 
comportamento  seguido de reforos e outras vezes no . Felizmente os pais no teriam mesmo 
condies de estar atentos e reforar todos os comportamentos de determinada classe que desejam 
que seus filhos adquiram, e usam, portanto, um esquema intermitente, que permite que, depois de 
certo tempo, as crianas adquiram hbitos e o reforo constante no seja mais necessrio. 
Por outro lado, vemos que certos comportamentos indesejveis so difceis de se extinguir. 
Acontece que provavelmente foram aprendidos num esquema combinado de razo varivel e 
intervalo varivel, que mais se aproxima do aleatrio e que  o que provavelmente ocorre na vida 
diria. Nenhuma me obviamente estaria atenta para disciplinar a criana toda vez que emite um 
comportamento de cinco em cinco minutos ou de trs em trs respostas e o que acontece  que os 
comportamentos s vezes tm uma conseqncia e s vezes no. Os comportamentos que 
compem o que alguns chamam de traos de personalidade (comportamentos agressivos, timidos, 
cooperativos, meticulosos, etc.) provavelmente so adquiridos em esquemas combinados de razo 
varivel e intervalo varivel e so portanto muito resistentes  extino. Os efeitos deste tipo de 
esquema so os que mais nos interessam para a compreenso do desenvolvimento da personalidade 
humana e por isto foram enfatizados aqui. Uma discusso detalhada dos efeitos de diversos 
esquemas de reforamento aplicados ao desenvolvimento da personalidade  apresentada por 
Lundin (1972). Estes efeitos so de grande importncia para o psiclogo que desejar fazer 
experimentao sobre o assunto ou aplicar na clnica programas de modificao de comportamento, 
porm escapam ao objetivo da presente obra. 
Fuga e esquiva: Os fenmenos de fuga e esquiva foram bastante estudados em Psicologia da 
aprendizagem animal e 
mais recentemente tambm com seres humanos. Ambos os comportamentos so reaes a 
estmulos aversivos (punies). Temos o comportamento de fuga no paradigma bsico em que um 
rato recebe um choque eltrico, mas se emitir determinado comportamento, por exemplo, saltar para 
um compartimento adjajacente, terminar o choque. Estes comportamentos que terminam uma 
situao aversiva ficam fortalecidos. No comportamento humano, teramos muitos exemplos: se a 
situao de sala de aula  muito aversiva para um estudante, o comportamento 
130 
131 
de fugir da sala quando o professor no est olhando torna-se fortalecido. Ou ainda, o 
comportamento de ir ao mdico pode se fortalecer porque termina a ansiedade de no saber que 
doena se tem. Ir ao dentista arrancar um dente pode ser fortalecido porque termina a dor de 
dentes. A situao de esquiva difere da de fuga no seguinte aspecto principal: Enquanto na fuga o 
comportamento serve para se fugir de um estmulo aversivo que j est atuando, na esquiva o 
comportamento serve para se evitar que um estmulo aversivo ocorra. No paradigma bsico, depois 
de um condicionamento de fuga, associa-se um estmulo discriminativo com o estmulo aversivo, por 
exemplo, acende-se uma luz alguns segundos antes do choque eltrico ser aplicado. O rato aprende 
ento a esquivar-se do choque, saltando para o outro compartimento antes mesmo que o choque 
ocorra, basta ver a luz que age como um S que sinaliza que o choque est por vir. O 
comportamento que serve para evitar um estmulo aversivo  um comportamento de esquiva. 
Estudar para uma prova para evitar ser reprovado  um comportamento de esquiva. Outro exemplo 
seria isolar-se de situaes sociais para evitar experincias desagradveis de ser criticado ou 
ignorado pelos outros. 
Alm desses fatos mais elementares de condicionamento, temos alguns conceitos S-R mais 
abstratos, na maioria mais chegados  linha de HulI e Spence do que a de Skinner: 
Hbito: Hbito  o fortalecimento de uma conexo entre estmulo e resposta. A fora do hbito  
funo, entre outros 
fatores, do nmero de vezes em que a conexo foi reforada. 
Motivao ou drive:  uma varivel que reflete o estado do organismo.  o que ativa o 
organismo,  um ativador 
generalizado. A motivao  definida operacionalmente em termos de nmero de horas de privao. 
Antes da maior parte dos experimentos de condicionamento costuma-se privar o rato de alimento, 
para aumentar o nvel de motivao. Em experimentos com crianas, tem-se experimentado privar a 
criana de uma interao gratificante com o experimentador, antes de uma tarefa de aprendizagem, 
a fim de verificar se crianas nessa condio experimental reagem melhor aos elogios (reforos 
sociais) do experimentador do que crianas que no tenham sido privadas (Gewirtz e Baer, 1958). 
Embora haja alguma controvrsia, este tipo de pesquisa tem ndicado que a privao aumenta a 
atuao do reforo social. Na concepo de HulI, a definio de re132 
foro  tudo aquilo que reduz o drive, enquanto que para Skinner, como j foi dito, estes conceitos 
no so observveis diretamente e a nica coisa que podemos afirmar  que reforo  aquilo que 
aumenta a probabilidade de ocorrncia de uma resposta. No sabemos realmente se o reforo 
aumenta a probabilidade de uma resposta porque reduz um drive ou por qualquer outra razo. De 
fato, algumas pesquisas indicam que seres humanos e mesmo animais em muitas situaes 
executam tarefa tendo como reforo uma situao estimuladora que obviamente aumenta o nvel de 
motivao ao invs de diminu-Ia. Por exemplo, pesquisas com macacos indicam que estes 
executam tarefas complexas, tendo como recompensa o privilgio de abrir uma janela e ver outro 
macaco, uma situao que obviamente  estimuladora e no redutora de drive. Olds e Milner 
(1954) tambm demonstraram que a estimulao eltrica de certas zonas do crebro pode agir como 
reforo positivo, outra situao que obviamente no envolve reduo de drive. Na prtica, o que  
importante  descobrir o que  reforador para determinada pessoa em determinada situao. No 
adianta dar balas a uma criana no intuito de fornecer um reforo positivo, caso a criana no goste 
de coisas doces. 
Hierarquia de hbitos: No organismo formam-se hierarquias de hbitos, isto , certos hbitos 
estabelecem-se mais fortemente do que outros. Quando um comportamento dominante na hierarquia 
de hbitos no pode ser emitido por alguma razo, surge o comportamento seguinte na hierarquia. 
Isto explicaria o fenmeno de regresso. Por exemplo, digamos que o comportamento normal 
reforado de um menino de cinco anos seja comer sozinho. Ao nascer um irmozinho menor, o mais 
velho poder sentir que no est recebendo ateno e reforos por comer sozinho. Poder recorrer 
ento a insistir que lhe dem comida na boca. 
Aprendizagem por observao: Alm dos princpios expostos acima, ao aplicar as noes de 
aprendizagem de comportamentos sociais, Bandura (1963) deu grande nfase ao princpio chamado 
imitao, que anteriormente fora sempre enquadrado entre os comportamentos adquiridos por 
condicionamento operante. Miller e Dollard (1941), por exemplo, em Social Learning and 
Imitation, falam de dois casos de imitao: 

133 
a) O comportamento imitativo que  reforado porque corresponde ao do modelo. Por exemplo, o 
menino que imita o pai saindo de casa com uma pasta para trabalhar provavelmente ser reforado 
pelo sorriso e aprovao do pai. 
b) O comportamento imitativo que ocorre porque o sujeito observa outra pessoa ser reforada por 
emitir aquele comportamento. Por exemplo, a criana que v a me de um coleguinha ceder a seu 
acesso de birra provavelmente imitara esse comportamento. Chamamos a este tipo de reforo de 
reforo vicrio, isto , em lugar do outro. 
Bandura acredita, porm, que a imitao  um princpio de aprendizagem em si prprio e que a 
aprendizagem pode-se fazer por imitao sem a ocorrncia de nenhum reforamentO, seja ao 
prprio indivduo, seja a um modelo. Seus experimentOS sobre a aquisio de comportamentos 
agressivos do evidncia bastante convincente para seu ponto de vista. A mera exposio a modelos 
agressivos, seja na vida real, seja em filmes, leva  aprendizagem de comportamentos agressivos 
que se manifestaro numa situao posterior, enquanto que em grupos de controle, expostos a 
modelos no-agressivos, a manifestao de agresso foi significantemente menor num ps-teste. 
Estes experimentos so apresentados e discutidos em mais detalhe no captulo sobre a agresso. 
Em resumo, podemos dizer que na teoria da aprendizagem social o desenvolvimento de todos os 
comportamentos habituais da pessoa, que constituem o que chamamos personalidade,  explicado 
em termos dos principios bsicos acima expostos: condicionamento clssico, condicionamento 
operante e imitao. 
A teoria da aprendizagem social tem tido enorme repercusso na prtica da Psicologia Clnica e da 
Psicologia Escolar, reas em que o psiclogo  chamado a fim de corrigir comportamentos 
inadequados ou desadaptados. Os pressupostos tericos da aprendizagem social so diferentes dos 
das demais teorias de Psicopatologia ou de Psicoterapia. Sem recorrer a foras internas e 
dinamismos inconscientes no observveis dos quais os comportamentos manifestos seriam meros 
derivativos, a teoria de aprendizagem social considera o desajustamento como comportamentos 
inadequados que foram aprendidos atravs de reforo positivo e imitao, ou como a ausncia 
de comportamentos adaptados que so inexistentes ou tm uma freqncia de ocorrncia muito 
baixa no repertrio de comportamentos dos sujeitos, porque no foram reforados positivamente no 
passado ou porque foram punidos. Assim, o problema da terapia resume-se em aprender novos 
comportamentos adequados e desaprender comportamentos inadequados. Para isto so utilizados os 
princpios bsicos de aprendizagem j descritos nesse captulo. Entre as principais tcnicas utilizadas 
na te rapia comportamental ou na modificao de comportamento encontram-se a utilizao do 
reforo positivo, a extino, a dessensibilizao sistemtica, a imitao e a estimulao aversiva. 
Vejamos alguns exemplos de estudos relatados em que uma ou mais dessas tcnicas foram 
empregadas. 
Extino: A eliminao de comportamentos inadequados pode ser obtida atravs da retirada de 
reforos positivos que 
estejam mantendo o comportamento. Williams (1959), em um caso j clssico nos livros de 
modificao de comportamento, relata o caso de um menino de 21 meses de idade, que devido a 
uma doena prolongada havia adquirido hbitos de grande dependncia, exigindo por meio de choro 
e birra que os pais ficassem no quarto at que adormecesse. Aplicando-se a tcnica de extino, os 
pais passaram a coloc-lo na cama tranqila- mente aps as rotinas de aprontar-se para dormir, 
fechando a porta do quarto e deixando-o l, ignorando os choros e gritos. Em poucos dias o 
comportamento foi extinto. Reapareceu depois, devido  chegada de uma tia que reforou 
positivamente o comportamento inadequado, tendo sido o menino submetido a outro perodo de 
extino. Novamente em menos de duas semanas o comportamento inadequado foi extinto, no 
ressurgindo nem havendo outros problemas posteriores. 
Terapia por retoramento positivo: Freqentemente vemos que muitos comportamentos 
indesejveis so mantidos porque recebem reforo positivo, enquanto que os comportamentos 
desejveis alternativos, j baixos em freqncia, passam desapercebidos. Por exemplo, numa sala de 
maternal, a professora tende a dar ateno a uma criana que chora, porm em geral ignora-a 
quando ela est brincando adequadamente. Ou zangamos com a criana que briga e agride, mas a 
ignoramos quando tem um comportamento de cooperao. Em uma srie de trabalhos 
interessantssimos, Harris, WoIf e Baer (1964) verificaram que uma professora de maternal 
realmente dispensava ateno a 
134 
135 
uma criana que chorava excessivamente na escola. Instruram- na a ignorar a criana nos 
momentos de choro e a utilizar reforos positivos (elogios, ateno) nos momentos em que no 
estivesse chorando. Em poucos dias, o comportamento de choro foi eliminado. Outra criana 
apresentava o comportamento bizarro de engatinhar quase todo o tempo na sala de maternal. A 
professora foi instruda a ignorar a criana quando engatinhasse, porm a dispensar carinho, afagos, 
etc., nos raros momentos em que se levantasse (como na hora de beber gua no bebedouro ou 
pendurar o casaco no cabide). Gradualmente o comportamento de andar em p aumentou e em 
poucos dias o engatinhar foi extinto. 
Rickard e Mundy (1965) relatam o caso de um menino de nove anos de idade com gagueira 
crnica. O tratamento consistiu em conceder pontos que podiam ser trocados por reforadores e 
que eram dados em seguida  emisso de fala sem gaguejar. Todo o comportamento de gaguejar foi 
ignorado. micialmente, eram apresentados ao garoto pequenas unidades tais como frases para 
repetir. O tamanho das frases foi aumentando at chegar a pargrafos inteiros que precisavam ser 
ditos sem nenhum gaguejo a fim de obter o reforo. 
Imitao: A utilizao de modelos que demonstrem o comportamento desejado tambm tem sido 
eficiente na modificao do comportamento. Bandura, Grusec e Menlove (1967) demonstraram um 
mtodo de eliminao de fobias em crianas em que outras crianas exibiam respostas de calma e 
aproximao diante do estmulo que causa medo aos sujeitos (por exemplo, cachorros). Em uma 
demonstrao experimental, os sujeitos foram 24 meninos e 24 meninas de trs a cinco anos de 
idade, que tinham forte medo de cachorros. A intensidade do medo dessas crianas foi avaliado 
antes do tratamento por meio de uma seqncia graduada de tarefas em que as crianas tinham que 
se envolver em interaes cada vez mais prximas com um cachorro (por exemplo, olhar para o 
cachorro dentro de um cercado, fazer festa no cachorro, caminhar com ele numa coleira e 
finalmente entrar no cercado com o cachorro). Cada criana que tinha medo foi colocada em uma 
situao experimental: O grupo 1, modelo com contexto positivo, participou em uma srie de 
festinhas agradveis. O grupo 2, modelo com contexto neutro, observou o mesmo modelo interagir 
com o cachorro, mas no houve festa. Os outros dois grupos foram grupos de con trole 
O grupo 3 compareceu a festas em que um cachorro foi trazido na sala, mas no observou os 
modelos que no tinham medo, e o grupo 4 participou de festas mas no teve exposio a modelos 
nem ao cachorro. Depois do tratamento, as crianas foram reavaliadas nas mesmas tarefas usadas 
no pr-teste. Os resultados indicaram que as crianas dos grupos 1 e 2 (que haviam observado os 
modelos) revelaram muito menos medo de cachorro do que as crianas nos dois grupos de controle. 
Houve tambm generalizao com relao a um cachorro diferente. Em outro estudo, o mesmo 
processo foi utilizado, com a diferena de que os modelos foram apresentados em filmes (Bandura e 
Menlove, 1968). 
Dessensibilizao sistemtica: Esta tcnica, cujos representantes mais importantes so Wolpe 
(1958) e Lazarus (1963),  mais filiada ao condicionamento clssico do que ao operante. A idia 
bsica consiste em que eliciao de uma resposta incompatvel com a ansiedade (relaxamento, por 
exemplo) em presena de estmulos que causam ansiedade far com que gradualmente esses 
estmulos deixem de provocar ansiedade. Este tipo de terapia  muito utilizado no tratamento de 
fobias. Lazarus (1960) descreve o caso de uma menina de nove anos que sofria de ansiedade de 
separao, terrores noturnos e sintomas psicossomticos na ausncia da me, no podendo mesmo 
ficar na escola. A menina recebeu sesses de relaxamento em que, quando inteiramente relaxada, 
deveria imaginar estar longe da me por perodos de tempo cada vez maiores. Depois de cinco 
sesses, durante um perodo de dez dias consecutivos, ao final dos quais a menina pde voltar  
escola, suas ansiedades foram eliminadas. Um follow-up 15 meses depois revelou que essa melhora 
fora mantida. 
Estimulao aversiva: Embora menos sada, e questionada por muitos, o uso da punio tem sido 
empregado em alguns casos, especialmente no tratamento do alcoolismo ou de distrbios de 
comportamento sexual. Voetglin e Lemere (1942) apresentam uma avaliao dos tratamentos de 
alcoolismo por estimulao aversiva, indicando bons resultados para essa tcnica, que consiste, 
basicamente, em associar a bebida alcolica com algum estmulo aversivo (injeo provocadora de 
nuseas). 
Raymond (1956) relata a cura de um caso de fetichismo. Com crianas, Lovaas (1967) 
principalmente tem conseguido sucesso com o uso de punio no tratamento de crianas 
136 
137 
autistas. Lovaas conseguiu a eliminao de comportamentos se- veramente autodestrutivos tais 
como bater com a cabea na parede ou morder-se a si prprio, utilizando a punio, seja por meio de 
isolamento da criana ou pela administrao de choque eltrico. Em duas crianas com quem 
Lovaas trabalhou, esses comportamentos autodestrutivos desapareceram numa questo de minutos 
e o sucesso foi mantido at 11 meses depois. A eliminao desse tipo de comportamento permite a 
apario de outros comportamentos positivos, tais como comportamentos que revelam alguma 
comunicao social e comportamentos verbais, que passam ento a receber reforo positivo por 
parte do terapeuta. Utilizando a imitao e o reforo positivo, Lovaas tem conseguido melhorar 
bastante o comportamento de crianas autistas, em casos em que os tratamentos tradicionais 
faljiaram totalmente. 
Apresentamos aqui apenas uma idia bastante geral do que seja a terapia comportamental ou a 
modificao de comportamento. Ao leitor que desejar aprofundar esse assunto, recomendamos a 
leitura de Hail (1973), Beech (1971), Krasner e Ullmann (1972) e Lundin (1972), todos traduzidos 
para o portugus. 
A terapia comportamental realmente conquistou a Psicologia Clnica e a Psicologia Escolar nos 
Estados Unidos por duas razes fundamentais:  de um rigor metodolgico inquestionvel, 
apresentando evidncia objetiva das curas ou melhoras obtidas, a ponto de satisfazer os cientistas 
mais rigorosos, e, por outro lado,  de extrema simplicidade, no requerendo conhecimentos 
esotricos. Seus princpios tm sido difundidos entre professores e pais, que podem perfeitamente 
utilizar algumas tcnicas bsicas como o reforo positivo de comportamentos desejveis, extino de 
comportamentos indesejveis. Os resultados so rpidos e objetivamente comprovveis, de forma 
que teve bastante aceitao. 
A teoria de aprendizagem social tem se modificado nos ltimos anos, sendo sua caracterstica atual 
a integrao entre princpios behavioristas e variveis cognitivas. No excelente artigo intitulado 
Toward a Cognitive Social Learning Theory, Mischel (1973) resume essa tendncia que parece 
humanizar o modelo skinneriano, dando nfase a variveis subjetivas e cognitivas. Como salienta 
Mischel,  preciso levarem-se em conta fatores como o valor subjetivo que um reforo tem para 
deter- 
minado sujeito, a representao cognitiva que o sujeito faz das provveis conseqncias de seus 
comportamentos, a expectnda que o sujeito tem em relao a receber reforos e a escolha que o 
sujeito faz dos comportamentos que quer adquirir atravs de uma terapia comportamental. Essa 
tendncia  tambm ntida nos trabalhos mais recentes de Bandura como Aggression (1973), bem 
como nos trabalhos sobre auto-eficcia e autoregulao (Bandura, 1977; 1982). 
Deve ficar claro ao leitor que o tratamento dado aqui  teoria de aprendizagem social  menos 
extenso que o dado  de Piaget, pela simples razo de que na Parte III os tpicos so focalizados 
principalmente sob o prisma da teoria de aprendizagem social, ao passo que, com exceo do 
captulo sobre julgamento moral, em que a contribuio de Piaget  discutida, h poucas referncias 
 teoria de Piaget na Parte III desse livro. A discusso de pesquisas sobre identificao, 
dependncia, agresso, comportamento moral, que aparecem na Parte III devem ser consideradas 
como um aprofundamento sobre as contribuies da teoria de aprendizagem social, teoria que tem 
tido grande aceitao na Psicologia do Desenvolvimento atual quanto  explicao do 
desenvolvimento de aspectos da personalidade humana. Sua competidora, a teoria de Piaget, de 
igual importncia, destaca-se quanto  contribuio que tem dado para a compreenso de aspectos 
cognitivos do desenvolvimento, mas no tanto para aspectos emocionais e sociais. 
Pelo rigor metodolgico, por atender melhor aos requisitos de uma teoria cientfica, e pelas 
utilssimas implicaes prticas que tem tido, a teoria de aprendizagem social merece lugar de 
grande destaque entre as teorias de desenvolvimento da personalidade humana. 
138 
139 
1_ 
